Estensione dei Metodi di Ranking mediante Analisi dell'Interspaziatura fra Occorrenze
نویسندگان
چکیده
L’analisi frequentistica delle occorrenze, tipica dei modelli di ranking di information retrieval, può essere integrata con l’analisi della spaziatura fra le occorrenze di una singola parola, mutuata dallo studio dei livelli di energia dei sistemi statistici di quanti disordinati. Queste due aree di ricerca sono fortemente interrelate, perché entrambe hanno l’obiettivo di assegnare dei pesi di rilevanza alle singole parole di un documento, e sembrano complementari, perché si basano su metodologie differenti. Tuttavia finora esse sono progredite in modo separato. L’obiettivo di questa ricerca è di favorire una loro riconciliazione. I contributi principali del lavoro sono tre: (a) estensione del metodo basato sull’interspaziatura mediante analisi di corpora, (b) verifica sperimentale che la pesatura quantistica è scorrelata da quella frequentistica, (c) studio della combinazione ottimale dei pesi quantistici e frequentistici ai fini del miglioramento delle prestazioni del ranking. Il risultato principale dei nostri esperimenti è che il metodo quantistico da solo non funziona bene, ma che il metodo combinato consente di migliorare in modo significativo le prestazioni del metodo classico frequentistico. Un ulteriore risultato riguarda le potenzialità di applicazione selettiva dei due metodi di pesatura: buone in funzione della lunghezza dei documenti recuperati, modeste rispetto alla difficoltà stimata delle interrogazioni.
منابع مشابه
Extending the K-Nearest Neighbour Classification Algorithm to Symbolic Objects
Riassunto: L’analisi di dati simbolici generalizza alcuni metodi statistici standard al caso di oggetti simbolici (SO). Questi oggetti, informalmente definiti “dati aggregati”, poiché sintetizzano le informazioni relative ad un gruppo di individui, possono essere confrontati al fine di individuare dei cluster, di classificarli o ordinarli in base al loro grado di generalizzazione. L’articolo pr...
متن کاملStrumenti di Verifica e Validazione di Codice Java
Sistemi informatici sempre più complessi sono ormai costantemente parte della vita di tutti i giorni di milioni di persone. Le applicazioni software che gestiscono questi sistemi informatici diventano man mano sempre più grosse e difficili da gestire e per questo l’incidenza del numero di bug al loro interno è diventata sempre più alta. La creazione di un software perfetto, ossia senza bug, è u...
متن کاملPer Gli Studenti Del Corso Di Elementi Di Analisi Numerica
correzione I esonero EAN correzione III esonero EAN testo III esonero EAN osservazioni su convergenza dei metodi φ e sui metodi Runge-Kutta (non presenti negli appunti al focal point) correzione II esonero EAN matrice di adiacenza dei ragazzi di EAN (..ha ilcellulare di..) ciò che ho insegnato di diverso rispetto agli anni scorsi sulla teoria di Perron-Frobenius, metodo delle potenze, pagerank ...
متن کاملActive Contour Segmentation for the Identification of Metallographic and Morphological Elements of Interest in Ductile Cast Iron
IMPIEGO DELLA SEGMENTAZIONE MEDIANTECONTORNI ATTIVI NELL’IDENTIFICAZIONEDEGLI ELEMENTI METALLOGRAFICI E MORFOLOGICIDI INTERESSE NELLE GHISE SFEROIDALI Parole chiave: ghise sferoidali, analisi di immagine,segmentazione, contorni attivi Le ghise sferoidali costituiscono una famiglia di ghise piuttosto versatilecaratterizzata da un ampio intervallo di proprietà meccaniche che p...
متن کاملLinguaggio Segreto di Dante e dei Fedeli d'Amore
Nel panorama degli studi comparati fra la lirica romanza medievale e quella orientale uno degli esempi eclatanti che nella sua storia ormai pluridecennale ha suscitato molte polemiche e discussione è stato senza dubbio il rinomatissimo Linguaggio segreto di Dante e dei Fedeli d'Amoredi Luigi Valli. Il suddetto tomo, come asserisce l’editore della casa editrice Luni, pubblicato per la prima volt...
متن کامل